انتخاب ویژگی در داده های بزرگ به کمک قابلیت های cuda روی gpu

پایان نامه
چکیده

انتخاب ویژگی یکی از مهمترین عملیات بر روی داده ها می باشد. به وسیله ی انتخاب ویژگی، ویژگی های کم¬ اهمیت حذف می شوند و باعث درک بهتر از داده ها می شود. داده های بزرگ به دلیل داشتن ابعاد زیاد، نیاز به زمان طولانی برای انجام محاسبات دارند. از طرفی روش های سنتی نمی¬توانند در زمان قابل قبولی داده های بزرگ را پردازش کنند. اخیراً، با پیشرفت تکنولوژی کارت گرافیک ها، استفاده از این ابزار در موازی سازی الگوریتم های تکاملی فراگیر شده است. یکی از الگوهای موازی سازی الگوریتم های تکاملی الگوی پایه-پیرو می باشد. در این نوشتار، دو نسخه ی موازی الگوریتم ژنتیک روی واحدهای پردازش گرافیکی با استفاده از برنامه نویسی cuda و مبتنی بر الگوی پایه-پیرو برای انتخاب ویژگی در داده های بزرگ پیاده سازی می شوند. محاسبه ی تابع برازندگی الگوریتم ژنتیک بر روی gpu پیاده سازی شده است. در هر دو نسخه ی پیاده سازی شده، به کمک وابستگی بین ویژگی های مجموعه ی داده، مجموعه ی داده به بخش هایی متناسب با تعداد نخ های درون بلاک کارت گرافیک تقسیم می شود. در نسخه ی اول، الگوریتم تنها یک دور اجرا می شود و در نسخه ی دوم، به دلیل وجود یک شرط توقف، الگوریتم می تواند بیش از یک بار اجرا شود. شرط توقف ارائه شده در نسخه ی دوم، برمبنای مقدار وابستگی بین ویژگی ها طراحی شده است. هدف از ارائه ی نسخه ی دوم، افزایش دقت الگوریتم موازی شده به وسیله ی تکرارهای مجدد می باشد. آزمایش ها بر روی 8 مجموعه ی داده با ابعاد متفاوت و بزرگ انجام شده است. نتایج با حرکت از مجموعه ها با ابعاد کمتر به سوی مجموعه های بزرگ، بین پیاده سازی سری و نسخه های موازی شده، سرعت قابل قبولی را گزارش داده اند. هر چند در روش¬های پیشنهادی سرعت بالاتر است؛ اما با توجه به اهمیت دقت در انتخاب ویژگی لازم است در کارهای آینده به بالا بردن دقت نیز توجه شود.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Hierarchical Clustering with CUDA/GPU

Graphics processing units (GPUs) are powerful computational devices tailored towards the needs of the 3-D gaming industry for high-performance, real-time graphics engines. Nvidia Corporation provides a programming language called CUDA for general-purpose GPU programming. Hierarchical clustering is a common method used to determine clusters of similar data points in multidimensional spaces; if t...

متن کامل

بررسی ویژگی های اپتیکی و اندازه ذرات گرد و غبار و وابستگی های آن ها به کمک داده هایAERONET

افزایش وقوع پدیده­های گرد و غباری لزوم تحقیقات در راستای شناسایی دقیق، پایش مداوم و مقابله با این پدیده را نشان می­دهد. در کنار شناسایی ویژگی­های شیمیایی، ویژگی­های اپتیکی و اندازه ذرات گرد و غبار نیز اهمیت فراوانی دارد. شناسایی گرد و غبار و ویژگی­های دقیق آن به وسیله سنجش از دور یک روش پیشرو و همچنان چالش برانگیز است که نیازمند اطلاعات از پیش تهیه­ای شده­ای از ویژگی­های اپتیکی و اندازه ذرات گر...

متن کامل

Takagi Factorization on GPU using CUDA

Takagi factorization or symmetric singular value decomposition is a special form of SVD applicable to symmetric complex matrices. The computation takes advantage of symmetry to reduce computation and storage requirements. The Jacobi method with chess tournament ordering was used to perform the computation in parallel on a GPU using the CUDA programming model. We were able to achieve speedups of...

متن کامل

Fast GPU-based Adaptive Tessellation with CUDA

Compact surface descriptions like higher-order surfaces are popular representations for both modeling and animation. However, for fast graphics-hardware-assisted rendering, they usually need to be converted to triangle meshes. In this paper, we introduce a new framework for performing on-the-fly crack-free adaptive tessellation of surface primitives completely on the GPU. Utilizing CUDA and its...

متن کامل

CUDA-Lite: Reducing GPU Programming Complexity

Abstract. The computer industry has transitioned into multi-core and many-core parallel systems. The CUDA programming environment from NVIDIA is an attempt to make programming many-core GPUs more accessible to programmers. However, there are still many burdens placed upon the programmer to maximize performance when using CUDA. One such burden is dealing with the complex memory hierarchy. Effici...

متن کامل

عیب یابی سازه‌ها به کمک داده های ارتعاشی

در این مقاله سه روش عیب‏یابی نرمی، تحلیل اجزای اصلی و تحلیل اجزای مستقل معرفی خواهند شد. به ‌علاوه، انجام آزمایش ارتعاشی به منظور استخراج پارامترهای مودال مورد بررسی قرار خواهد گرفت. اندازه‌گیری دقیق توابع پاسخ فرکانسی نقطه‌ای به منظور نرمال سازی شکل مودها و محاسبه ماتریس نرمی نیز به عنوان ملزومات این روش مطرح خواهند شد. در عین حال، روش تحلیل اجزای اصلی به مثابه روشی کارآمد به همراه نتایج عددی ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023